"кодовая страница" звучат устрашающе для начинающего пользователя Сети, потому что в них таится причина многих преследующих его бед.
Для кодирования символа в компьютерах обычно используется один байт. Как вы помните, с помощью одного байта (восьми бит) можно закодировать 256 символов. Расставленные по номерам кодов, символы образуют таблицу кодов, или кодировку. 256 символов - это совсем немного. В первые 128 мест укладываются цифры, буквы латинского алфавита, знаки препинания и некоторые другие символы. Во вторые 128 мест, верхнюю часть кодовой таблицы, исходно были помещены символы из алфавитов западноевропейских языков.
Когда потребовалось использовать кириллические символы, то выяснилось, что места для них в кодовой таблице уже нет. Поэтому на них стали заменять верхние 128 символов таблицы. Именно эта замена верхней части кодовой таблицы операционной системы и называется русификацией.
Однако в разных операционных системах была принята разная расстановка кириллических символов внутри таблицы.
И когда компьютеры стали взаимодействовать друг с другом в Интернете, начали возникать проблемы, связанные с тем, что русский текст, набранный на компьютере под управлением одной операционной системы, невозможно прочитать на компьютере под управлением другой.
Традиционно в Интернете очень широко используются компьютеры под управлением операционных систем семейства UNIX. Они и по сегодняшний день составляют большую часть серверов Сети. В этих операционных системах используется русская кодировка КОИ-8. Аббревиатура КОИ расшифровывается как "Код Обмена Информацией", восьмерка обозначает, что для кодирования одного символа требуется восемь бит.
В операционных системах от корпорации Microsoft используются две разных кодировки. В MS DOS применяется кодировка CP866 (CP - англ. от code page, кодовая страница), также известная как "альтернативная" (ALT). В операционных системах семейства Windows кириллические символы обычно кодируются в стандарте CP1251.
Кроме того, существует отдельная русская кодировка, применяемая в компьютерах Macintosh фирмы Apple. Она обычно так и обозначается - MAC.
Помимо перечисленных выше кодировок, используемых в различных операционных системах, есть еще одна - ISO-8859-5. Она никем никогда не применялась, зато первой была стандартизована.
Основные кодировки русской Сети - КОИ-8 и Windows CP1251. Русские тексты в кодировке КОИ-8 встречаются в Интернете на каждом шагу, так же как и компьютеры под управлением операционных систем семейства UNIX. По мере роста популярности Сети в ней становится все больше пользовательских компьютеров, на которых стоит Windows. Поэтому кодировка CP1251 также получила очень большое распространение. Значительная часть документов российского WWW использует кодировку CP1251. Выбор той или иной кодировки для своих веб-документов - вопрос "религиозного исповедания".
В соответствии со стандартами Интернета, веб-сервер передает браузеру кодировку документа, и он автоматически перекодирует его. Но этот порядок еще не вполне прижился в Сети, поэтому иногда приходится осуществлять операцию смены кодировки вручную. В Netscape Navigator кодировка динамически меняется в разделе "Encoding" меню "View". Первым делом попробуйте кодировки КОИ-8 и CP1251.
Многие сервера позволяют вручную выбрать кодировку, в которой сервер посылает документы браузеру, на тот случай, если он не поддерживает смену кодировок. Ссылки с названиями кодировок, которые встретятся вам на многих вебстраницах, предназначены специально для этого. В тех редких случаях, когда вам понадобится использовать эту возможность, выбирайте ту кодировку, которая используется в операционной системе, установленной на вашем компьютере: CP1251 для Windows, КОИ-8 для UNIX и т.д.
Если браузер выдает ошибку "Document not found", это означает, что запрашиваемый вами документ отсутствует на указанном сервере (проверьте, правильно ли вы задали его адрес). Ошибка "Access forbidden" означает, что доступ к запрашиваемому документу запрещен.
Иногда браузер не находит сервер, на котором расположен запрашиваемый документ. В этом случае сервер с таким именем либо действительно не существует (проверьте, правильно ли вы набрали его имя в адресной строке), либо время запроса к серверу службы доменных имен (DNS) истекло раньше, чем он возвратил цифровой адрес, соответствующий данному имени. В последнем случае при повторном обращении к серверу ошибка исчезнет.
Если вы точно знаете, что сервер, к которому вы обращаетесь, существует, но вам не удается получить к нему доступ, обратитесь к системному администратору или в службу технической поддержки вашего провайдера. Возможно, произошел сбой подключения к Интернету.
Назад |
Оглавление |
Дальше